﻿ Șințe umaniste în vizorul informacii Păstrarea moștenirii culturale și prelucrarea conținutului textual Dan Cristea Ce înseamnă și de ce “Digital Humanies”? • Prelucrarea pe calculator a datelor cu care operează umanioarele – ansamblul de teorii, metode și instrumente care facilitează aceste cercetări 2 Dies Academici, UAIC Iași, 26 octombrie 2017 Digital? Pentru ce? • Reproducem în digital pentru că realul e atât de prețios și nu vrem să-l pierdem, nu pentru că surogatul digital ar ﬁ de mai mare valoare decât realul… conservarea realului 3 Dies Academici, UAIC Iași, 26 octombrie 2017 Digital? Pentru ce? • Reproducem în digital pentru că realul e atât de prețios și nu vrem să-l pierdem, nu pentru că surogatul digital ar ﬁ de mai mare valoare decât realul… • Dar și pentru că, folosind acest format, sperăm să descoperim fapte necunoscute încă, corelații, regularități (paernuri) câmp experimental 4 Dies Academici, UAIC Iași, 26 octombrie 2017 Travelers on the Grand Tour @ Stanford University Un dicționar al călătorilor britanici și irlandezi în Italia, 1701-1800, ed John Ingamells, Yale University Press, 1997) hp://republicoﬂeers stanford edu/casestudies/grandtour html 5 Dies Academici, UAIC Iași, 26 octombrie 2017 Călătorind în Italia sec XVIII 6 Dies Academici, UAIC Iași, 26 octombrie 2017 Călători în orașele Italiei 7 Dies Academici, UAIC Iași, 26 octombrie 2017 Trasee 8 Dies Academici, UAIC Iași, 26 octombrie 2017 Timelines 9 Dies Academici, UAIC Iași, 26 octombrie 2017 Spațiul social 10 Dies Academici, UAIC Iași, 26 octombrie 2017 Conservarea cărților vechi Un proiect grecesc Thanks to Eleni Galiotou (2014) Using digital corpora for preserving and processing cultural heritage texts: a case study, in Library Review, vol 63, 6/7, p 408-421 11 SYNASC, UVT Timișoara, 27 Sept 2016 Biblioteca Sﬁntei Mănăsri istorice a Vesrii Fecioarei • Insula Skiathos, Grecia • Colecția: – temaca: dogmacă, hermeneucă, ascecă, liturgică, ﬁlosoﬁe, geograﬁe, matemacă, gramacă, muzică religioasă, ediții (adnotate) de Homer, Tucidides, Aristotel etc – limba: greacă în diacronie – manuscrise și părituri din sec 16 – 19 originare din: Veneția, Verona, Roma, Genova, Atena, Smirna, Constannopole, Basel, Viena, Leipzig, Berlin, Paris, Londra, Petersburg, Moscova, Bucureș, Iași, etc – starea originalelor: în general, precară 12 SYNASC, UVT Timișoara, 27 Sept 2016 Cea mai veche carte Evanghelia, Veneția, 1536 – cu încuviințarea Elenei Galiotou 13 SYNASC, UVT Timișoara, 27 Sept 2016 Scopul proiectului • Să prevină deteriorarea în connuare a originalelor • Să permită accesul la texte și să faciliteze acvitatea cercetătorilor: teologi, istorici, ﬁlologi, paleologi etc 14 SYNASC, UVT Timișoara, 27 Sept 2016 Tehnologia • Clasiﬁcarea manuală a documentelor – număr, tlu, autor/editor, limba, editura, an publicare, țara etc => metadate • Digizare – un aparat foto și un trepied • 114 manuscrise și 289 cărți părite digizate => 189,000 imagini jpeg de pagini 15 SYNASC, UVT Timișoara, 27 Sept 2016 Accesul • Ulizatorul poate: – accesa și inspecta o carte, pagină cu pagină – căuta ocurențe • se generează ﬂexiuni în diacronie: limba se schimbă în sec 17-18 • se compun formele graﬁce ale cuvintelor • se compară cu porțiuni din documentele scanate – pări zone din copiile scanate 16 SYNASC, UVT Timișoara, 27 Sept 2016 Vilnius’ literature mapping project ”An invitaon to walk the city with the eyes of a reader” hp://www vilniusliterature ﬂf vu lt/ 17 From E-READ COST Conference, Vilnius, 27-29 Sept 2017 Vilnius’ literature mapping project • Dezvoltat de câțiva profesori și cartograﬁ în Universitatea Vilnius • De ce o hartă literară a unui oraș? – pentru a-l “ci” pe un strat mai adânc decât cel aﬂat imediat la vedere 18 From E-READ COST Conference, Vilnius, 27-29 Sept 2017 19 From E-READ COST Conference, Vilnius, 27-29 Sept 2017 Dar orice alt loc poate ﬁ văzut ca un cronotop • Hărți literar-emoționale – adaugă la spațiu și o dimensiune temporală – permite citorului să acceseze citate – idee: arată citorului zone care au o încărcătură emoțională pozivă/negavă Bakhn, M M (1981) "Forms of me and the chronotope in the novel" In The Dialogic Imaginaon Ausn: Univ Texas Press pp 84–258 20 Thanks to Dana Bădulescu: E-READ COST Conference, Vilnius, 27-29 Sept 2017 MappingBooks Evadează din carte în lumea virtuală și reală! 21 Zilele BCU, Iași, 9 noiembrie 2015 Cum a apărut ideea… 22 Zilele BCU, Iași, 9 noiembrie 2015 Ah… nu-mi mai amintesc toate relațiile de rudenie menționate în carte! Zilele BCU, Iași, 9 noiembrie 2015 Personajele din “Forsyte Saga” • The old Forsytes Ann, the eldest of the family Old Jolyon, the patriarch of the family, having made a fortune in tea James, a solicitor, married to Emily, a most tranquil woman Swithin, James's twin brother with aristocrac pretensions; a bachelor Roger, "the original Forsyte" Julia (Juley), a ﬂuery dowager; Mrs Sepmus Small Hester, an old maid Nicholas, the wealthiest in the family Timothy, the most cauous man in England Susan, the married sister • The young Forsytes Young Jolyon, Old Jolyon's arsc and free-thinking son, married three mes Soames, James and Emily's son, an intense, unimaginave and possessive solicitor, married to the unhappy Irene, who later marries Young Jolyon Winifred, Soames's sister, one of the three daughters of James and Emily, married to the foppish and lethargic Montague Dare George, Roger's son, a dyed-in-the-wool mocker Francie, George's sister and Roger's daughter, emancipated from God • Their children June, Young Jolyon's deﬁant daughter from his ﬁrst marriage; engaged to an architect, Philip Bosinney, who becomes Irene's lover Jolly, Young Jolyon's son from his second marriage; dies of enteric fever during the Boer Wars Holly, Young Jolyon's daughter from his second marriage, to June's governess Jon, Young Jolyon's son from his third marriage, to Irene, Soames's ﬁrst wife Fleur, Soames's daughter from his second marriage, to a French Soho shopgirl Annee; Jon's lover; later marries a baronet, Michael Mont Val, Winifred and Montague's son; ﬁghts in the Boer Wars; marries his cousin Holly Imogen, Winifred and Montague's daughter • Others Parﬁ, Old Jolyon's butler Smither, Aunts Ann, Juley and Hester's housekeeper Warmson, James and Emily's butler Bilson, Soames's housemaid Prosper Profond, Winifred's admirer and Annee's lover 24 Zilele BCU, Iași, 9 noiembrie 2015 25 Zilele BCU, Iași, 9 noiembrie 2015 Ce ar ﬁ să pot ieși afară din carte… Çelebi Mh , Maç Sk, Beyoğlu, Turkey to Çukur Cuma Cd, Beyoğlu, Turkey - Google Maps10/3/13 8:13 PMKatip Directions to Çukur Cuma Cd, Beyo!lu, Turkey 400 m – about 4 mins Walking directions are in beta Use caution – This route may be missing sidewalks or pedestrian paths Katip Çelebi Mh , Maç Sk, Beyo!lu, Turkey" 1 Head southwest on Maç Sk toward Baltacı Çkgo 75 m About 47 secstotal 75 m 2 Turn right onto Turnacıba"ı Cdgo 28 m total 100 m 3 Turn left onto A!a Külhanı Sk (Altıpatlar Sk )go 130 m About 2 minstotal 240 m 4 Continue onto Çukur Cuma Cdgo 150 m About 1 mintotal 400 m 26 Zilele BCU, Iași, 9 noiembrie 2015 Page 1 of 2https://maps google com/maps?f=d&source=s d&saddr=Maç+Sokak,+I…,288 55,2 369,37 281,0&layer=c&ei=OqVNUp3mE8nTtAaWr4CgCQ&pw=2 Către… cărțile vii • Construcții muldimensionale care combină date de natură textuală, geograﬁcă, temporală • Pune în evidență mențiunile de persoane, locații… • Ulizează tehnici de legare a entăților (enty linking) – conectează mențiuni din carte în lumea virtuală • Legături sensibile la: – contextul mențiunii din carte – locația curentă a citorului – momentul lecturii – personalitatea și preferințele citorului 27 Exemple de ulizare - Vizitez un oraș cu un ghid de călătorie în mână - locurile de interes, traseele, sunt re-ordonate în funcție de poziția mea - Sunt elev și călătoresc cu trenul de la Sibiu la Bucureș… - dacă îmi deschid tableta și o îndrept spre fereastra din dreapta, voi vedea semnalate vârfurile munților Făgăraș, exact ca în manualul de Geograﬁe - Sunt în Paris pentru a 3-a oară… - dar numai acum ghidul meu MB Lonely Planet îmi semnalează această expoziție deschisă în Piramidă 28 Zilele BCU, Iași, 9 noiembrie 2015 MappingBooks: mulțumiri • Studenților de la Fac Informacă – protop, ca proiect de semestru la cursul de IA, 2013-2014 • Grant al Ministerului Educației și Cercetării, iulie 2014 – septembrie 2017 • Colegilor mei: Ionuț Pistol, Daniela Gîfu (Fac Informacă), Mihai Niculiță (Fac Geograﬁe) • Univ “Ștefan cel Mare” Suceava • SIVECO – Bucureș 29 Zilele BCU, Iași, 9 noiembrie 2015 eDTLR Dicționarul tezaur al limbii române în format electronic (2007 – 2010) 30 Dep Științe, UAIC Iași, 14 aprilie 2011 Dicționarul: stasci • DA + DLR – 36 volume – 13 230 pagini – 138 128 intrări – citate: aprox 88% din text • eDTLR – 133 885 intrări recunoscute – 294 430 sensuri recunoscute – 621 976 citate recunoscute 31 Dies Academici, UAIC Iași, 26 octombrie 2017 eDTLR în stasci 120000 Entries per leer Senses per leer 100000 Quotes per leer 80000 60000 40000 20000 0 A B C D E F G H I Î J K L M N O P Q R S Ș T Ț U V W X Y Z 32 Dies Academici, UAIC Iași, 26 octombrie 2017 33 eDTLR: mulțumiri • Grant al Ministerului Educației și Cercetării, 2007-2010 • Partenerilor: – Facultatea de Informacă Universitatea „Alexandru Ioan Cuza” din Iaşi – Instutul de Lingviscă „Iorgu Iordan – Al Rose”, Academia Română, Bucureş Responsabil de proiect: acad Marius Sala – Instutul de Filologie Română „A Philippide”, Academia Română, Iaşi Responsabil de proiect: dr Gabriela Haja – Instutul de Lingviscă şi Istorie Literară „Sexl Puşcariu”, Academia Română, Cluj- Napoca Responsabil de proiect: dr Rodica Marian – Instutul de Cercetări pentru Inteligenţă Arﬁcială, Academia Română, Bucureş Responsabil de proiect: acad Dan Tuﬁş – Instutul de Informacă Teorecă, Academia Română, Iaşi Responsabil de proiect: acad Horia Neculai Teodorescu – Facultatea de Litere, Universitatea „Alexandru Ioan Cuza” din Iaşi Responsabil de proiect: prof dr Eugen Munteanu • Lui Gabi Haja, Mădălin Petrașcu și Alex Moruz – pentru corecturi, stasci, parsări, interfață etc 34 Dies Academici, UAIC Iași, 26 octombrie 2017 COROLA Corpusul computațional reprezentav al limbii române contemporane (2014 – 2017) 35 Dies Academici, UAIC Iași, 26 octombrie 2017 Operații de colectare, prelucrare, stocare Portal 36 Ro-NLP, Iași, 24 martie 2016 Fluxul de preluare a datelor: Curator – Editor/autor – Portal Portalul COROLA 37 Ro-NLP, Iași, 24 martie 2016 Fluxul de curățare/completare a datelor: Portal – Voluntari – Portal • Curățare • Completare metadate Portalul COROLA 38 Ro-NLP, Iași, 24 martie 2016 Datele sunt documentate: metadate CMDI standard Metadata Element Set 1 Document title 2 Author name 3 Publication date 4 Source 5 Source name 6 Translator name 7 Medium 8 Document style 9 Document text domain 10 ISSN/ISBN CMDI – Component MetaData Infrastructure (CLARIN) Un cadru de descriere și reutilizare a metadatelor documentelor 39 Ro-NLP, Iași, 24 martie 2016 Fluxul de prelucrare a datelor: Portal Portalul COROLA• Adnotări: • cuvinte și fraze • părți de vorbire • leme • informații morfologice • TOKPOSLEM Iași, 24 martie 2016 pipe-lineRo-NLP, Ulizarea datelor din corpus: Portal – Ulizatori Portalul COROLA 41 Ro-NLP, Iași, 24 martie 2016 Concordanțe (KWIC – Key Word In Context) … 42 Ro-NLP, Iași, 24 martie 2016 Ulizarea datelor din corpus: Portal – cercetarea în PLN Modele de limbă folosite în antrenamentul sistemelor de PLN Portalul COROLA 43 Ro-NLP, Iași, 24 martie 2016 COROLA: mulțumiri • Proiect prioritar al Academiei Române • Partenerii: – Instutul de Cercetări pentru Inteligenţă Arﬁcială, Academia Română, Bucureş Responsabil de proiect: acad Dan Tuﬁş – Instutul de Informacă Teorecă, Academia Română, Iaşi Responsabil de proiect: acad Horia Neculai Teodorescu • Colegilor de la IIT: Cecilia Bolea, Mihaela Onofrei, Daniela Gîfu, Andrei Scutelnicu, Alex Moruz, Laura Pistol – pentru procurarea documentelor, corecturi, stasci, interfața Plaormei • Conf dr Ruxandra Cosma, Univ Bucureș – pentru proiectul DRUKOLA • Colegilor de la IDS Mannheim pentru interfațad e acces KorAP • Zecilor de studenți de la UAIC și Politehnica Bucureș, pentru operații de corecții 44 Dies Academici, UAIC Iași, 26 octombrie 2017 Dar e mai mult decât atât… • Nu șințele umaniste în vizorul informacii! Ci invers – Humanies + Design - a Research Lab at Stanford University (hp://hdlab stanford edu/) => • Și-au propus să producă, prin obiecvul anchetei umaniste, noi moduri de gândire în design și informacă pentru a servi cercetărilor din domeniul șințelor umaniste • Consideră că cercetarea umanistă, bazată pe interpretare, poate contribui la dezvoltarea tehnologiilor, atunci când acestea sunt puse să dezvăluie ambiguitatea și paradoxul, permițând explorarea pe scară largă a sistemelor complexe 45 Dies Academici, UAIC Iași, 26 octombrie 2017 Vă mulțumesc! 46 